EvoClass
AI012
Menggali Lebih Dalam tentang Model Bahasa Besar
Studi Kasus dan Strategi Pengembangan Model Bahasa Besar yang Umum
Tujuan Pembelajaran
- Analisis perbedaan struktur antara arsitektur Encoder-only (BERT), Decoder-only (GPT), dan Encoder-Decoder (T5).
- Jelaskan proses pelatihan tiga tahap: Pelatihan Awal (model dasar), Penyesuaian Instruksi (SFT), dan Penyelarasan (RLHF/PPO).
- Bandingkan kinerja, hukum skala, dan inovasi arsitektur dari model bahasa besar utama seperti GPT, Llama, Qwen, dan DeepSeek.